亚洲中文字幕无码AV,九九天天干人妻天天操天天玩,色欲久久国产色AV免费看老司,国产熟妇另类久久久久

【20年品牌建站】找北京網站建設公司就選新鴻儒/提供北京網站建設報價/北京網站制作/北京網站設計/網站開發、北京網站建設公司電話【400-024-1998】有優惠哦!
簡體
繁體 簡體
我們的服務遍布中國

我們的服務遍布中國
乃至世界

新鴻儒所服務的品牌地域與城市
北京 天津 上海 廣州 深圳 香港 廈門 江蘇 浙江 山東
重慶 長沙 武漢 成都 西安 寧夏 麗江 青海 云南 烏魯木齊
黑龍江 內蒙古 河北 ...
新鴻儒服務與合作的全球各地
美國 加拿大 德國 法國 英國 瑞士 意大利 荷蘭
印度 日本 韓國 ...

不論你的品牌在何處
我們都可以提供完善的服務與幫助

致電

400-024-1998

網頁結構化的過程 即有價值信息被保留的過程

發布時間:2013-12-07 瀏覽:304打印字號:


向大家介紹過網頁結構化的目標,結構化的過程就是網站有價值信息被保留的過程,今天之所以又用這樣的標題來寫一篇文章,其實是有目的的,是想再次的提醒網站seo優化人員,搜索引擎工作原理是做好網站優化工作的基礎。
  現在不比前幾年,一說網站優化一說SEO優化,改改title,discription,keyword,發發外鏈,網頁的排名效果就會有。但現在僅僅指望這點已經不起作用了,人人都會的東西,你再拿出來作為自己的優勢,實際上是落伍了,再加上黑帽seo優化的猖獗,針對百度的優化,針對google的優化層出不窮,搜索引擎也在不斷的調整著算法。要做SEO優化的前鋒戰士,根據互聯網的發展變化,時時保持清醒的頭腦,吸收新的知識,只有這樣網站的優化效果才可能在你的控制之中。
  話回正題,來簡單解釋一下,網頁結構化的過程即有價值信息被保留的過程。明白了網頁結構化的目標后,就應該明白,體現網頁本身價值和內容的5個屬性被抽取出來,即,標題(title)、錨文本(anchor text)、正文標題(content title)、正文(content)和正向鏈接(link)。對搜索引擎來說,這5個屬性就是有價值的信息(當然,也是對用戶有價值的內容)。
  我們來具體看一下網頁結構化是如何進行的?
  網頁結構化的過程首先通過標簽樹進行分析得到文本對應的標簽,然后通過投票算法確定正文及配圖等僅從HTML標簽無法判斷的網頁數據。以下是專業人士總結的兩步走:
  HTML標簽樹
  一、 建立html標簽樹(tag-tree)。
  萬維網上大多數的靜態網頁都以HTML網頁形式存在,HTML是一種標識語言(Markup Language),它把其描述的全部內容都按照HTML語法存放在標簽之中。為了更清楚地描述網頁內容的組織結構,將網頁中的標簽按照出現順序依次整理出來并用適當的結構記錄。由于標簽之間的嵌套關系,因此整理結果自然是一個樹狀結構,我們把整理一個網頁中的標簽得到的樹狀結構稱為該網頁的“標簽樹”。
  很顯然,查看該網頁的用戶看到的是相當友好的信息。而實際源文件中的那些HTML標記,如和(可以理解為用來幫助IE瀏覽器理解網頁)等都不會實際地展示給用戶。因此搜索引擎的分析系統需要學習IE瀏覽器理解網頁的方式來理解網頁,在理解過程中需要建立一個HTML標簽樹的樹形結構。通過建立標簽樹,并且識別標簽所描述的文字,網頁結構化進程就走出了重要的一步,能夠順利提取出了網頁的標題。但實際的網頁,同一個標簽所描述的文字內容不是唯一確定的,比如廣告內容也可能放在標簽里,而這不是真正的正文,是會影響用戶的搜索體驗,所以就有了下面投票法得正文。
  二、通過投票方法識別正文的文本塊,并按照深度優先遍歷的規則組織為正文。
  判斷哪個文本塊是正文采用稱為“投票算法”的計算方法,這種方法在搜索引擎別常用。在日常生活中幾乎所有人都會有投票或選舉的經歷,如選舉干部和通過決議需要投票,以及運動員的一套動作需要裁判員打分等。其基本原理在于認為大多數人的意見往往是正確的。大多數人的統一主觀意見就會變得較為客觀。雖然每個人的給出的分數是主觀產生的,但是這種評判的方法和結果被認為是相對客觀和可信的。正文抽取的投票算法的過程如何呢?首先搜索引擎會定義一系列的規則,然后通過這些規則為每個文本塊打分。得分最高的被認為是正文的可能性足夠大,并且可以接受。搜索引擎定的規則,也是需要通過足夠多的網頁進行反饋,之后才能得到一個公正客觀的打分。由于HTML標簽的相互嵌套的特性,決定了深度優先遍歷的順序恰好能夠組織成一個完整的正文。

現在就與新鴻儒客服交流

400-024-1998

您也可進行在線咨詢或預約項目顧問
我要預約
在線咨詢